排序方式: 共有23条查询结果,搜索用时 15 毫秒
1.
在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率. 相似文献
2.
3.
基于一阶谓词逻辑的一阶规则挖掘方法可处理多表挖掘且具有强的知识表达能力,成为数据挖掘(DM)技术中一种渐受重视的新方法。为了解决现有方法规则获取的性能瓶颈问题,该文提出了一种新的基于遗传算法的一阶规则挖掘算法(GILP)。实验结果表明,GILP算法能有效地挖掘一阶规则。 相似文献
4.
OWL已经成为重要的知识表示和交换方式.OWL驱动的问答系统是比搜索引擎更具挑战性的研究.本文致力于解决为自然语言问题获取正确的OWL解释.考虑到问题理解的复杂性,影响因素的多样性,本文提出一种基于约束的语义映射方法.该方法分解问题成为变量,索引OWL知识成为变量域,抽象约束形成函数.并建立了目标函数完成问题变量在候选OWL知识库中获取合理解释的过程.该方法基于网络智能研究院知识库和问题集进行了初步评估.实验结果表明:和传统基于关键字匹配的算法比较,本文提出的方法使可解释问题比例增加了18%左右. 相似文献
5.
模板的自动抽取算法对机器翻译的研究具有重要意义。从面向英汉翻译的角度出发,论文对基于句子比较的翻译模板抽取(ATTEBSC)算法及其改进开展了比较研究,结果发现传统ATTEBSC算法在处理大规模语料库时运行效率较低,而且产生的无用模板比例较高,其中一个重要原因是没有事先对双语对齐语料库进行分类处理。通过相似性分析对句子进行聚类处理后再运行ATTEBSC算法,则发现该算法的运行效率和有用模板的比例都获得了较大的提高。 相似文献
6.
一阶规则空间中的θ-包容序是一个quasi-order序(自反的和传递的),采用通常的基于规则覆盖例子数目的评判标准,沿着这个quasi-order序挖掘一阶规则时,存在一阶规则的等价类问题,严重地降低了算法的搜索效率和规则的可读性。采用基于规则绑定数目的评判标准则可有效区分等价规则的优劣,正确地指导算法的搜索方向。 相似文献
7.
8.
遗传归纳逻辑程序设计的个体编码生长现象 总被引:3,自引:0,他引:3
遗传归纳逻辑程序设计(GILP)的个体编码生长现象严重影响了算法的性能和规则的可读性.通过对变长编码的模式分析,解释了GILP的个体编码生长现象.并发现,若从初始种群开始添加长度惩罚项来解决个体编码生长问题,种群会出现退化现象.而采取在演化的初期不添加惩罚项,在种群的性状有了明显改善后再添加惩罚的策略,既可避免种群退化,又可有效解决个体编码生长问题. 相似文献
9.
采用遗传算法(GA)作为归纳逻辑程序设计(ILP)的搜索策略,可以提高ILP方法的鲁棒性和适应性,文章简要叙述了对作者提出的遗传归纳逻辑程序设计(GILP)算法作的改进,测试了选择策略对GILP算法收敛性能的影响,采用不同的选择策略不会影响算法的最终收敛结果,但会产生不同的选择压力,导致算法具有不同的收敛速率。 相似文献
10.
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。 相似文献